Text copied to clipboard!

Titel

Text copied to clipboard!

Webbplatsens tillförlitlighetsingenjör (SRE)

Beskrivning

Text copied to clipboard!
Vi söker en erfaren och engagerad Webbplatsens tillförlitlighetsingenjör (SRE) som vill vara med och bygga robusta, skalbara och tillförlitliga system. I denna roll kommer du att arbeta nära utvecklingsteam, drift och andra intressenter för att säkerställa att våra webbapplikationer är tillgängliga, snabba och säkra dygnet runt. Du kommer att spela en nyckelroll i att förbättra våra system genom automatisering, övervakning och incidenthantering. Som SRE kommer du att ansvara för att designa och implementera lösningar som förbättrar systemets tillförlitlighet och prestanda. Du kommer att arbeta med att identifiera flaskhalsar, optimera infrastruktur och utveckla verktyg för att förbättra driften. Du kommer också att delta i beredskapsscheman och hantera incidenter när de uppstår, samt analysera rotorsaker och föreslå förbättringar. Vi värdesätter en kultur av samarbete, lärande och ständig förbättring. Du kommer att ha möjlighet att påverka tekniska beslut och bidra till att forma vår tekniska strategi. Vi söker dig som har en stark teknisk bakgrund, är lösningsorienterad och har ett stort intresse för att bygga tillförlitliga system. För att lyckas i denna roll bör du ha erfarenhet av molnplattformar som AWS, GCP eller Azure, samt goda kunskaper i programmeringsspråk som Python, Go eller Java. Du bör också ha erfarenhet av containerteknologier som Docker och Kubernetes, samt verktyg för övervakning och logghantering som Prometheus, Grafana och ELK. Om du är passionerad för tillförlitlighet, automatisering och systemdesign, och vill arbeta i en dynamisk och tekniskt utmanande miljö, är detta rätt roll för dig.

Ansvar

Text copied to clipboard!
  • Övervaka och förbättra systemets tillförlitlighet och prestanda
  • Utveckla och underhålla automatiseringsverktyg för drift
  • Delta i incidenthantering och rotorsaksanalyser
  • Samarbeta med utvecklingsteam för att förbättra systemdesign
  • Implementera och förbättra övervaknings- och loggningslösningar
  • Delta i beredskapsscheman och hantera driftstörningar
  • Optimera infrastruktur och identifiera flaskhalsar
  • Bidra till tekniska beslut och strategier
  • Dokumentera processer och systemarkitektur
  • Utbilda teammedlemmar i bästa praxis för tillförlitlighet

Krav

Text copied to clipboard!
  • Erfarenhet av molnplattformar som AWS, GCP eller Azure
  • Goda kunskaper i programmeringsspråk som Python, Go eller Java
  • Erfarenhet av containerteknologier som Docker och Kubernetes
  • Kunskap om CI/CD-processer och verktyg
  • Erfarenhet av övervakningsverktyg som Prometheus och Grafana
  • Förmåga att felsöka komplexa systemproblem
  • Stark kommunikations- och samarbetsförmåga
  • Erfarenhet av infrastruktur som kod (IaC), t.ex. Terraform
  • Förståelse för nätverk och säkerhet i distribuerade system
  • Relevant högskoleutbildning inom datateknik eller liknande

Potentiella intervjufrågor

Text copied to clipboard!
  • Vilken erfarenhet har du av att arbeta med molnplattformar?
  • Hur hanterar du incidenter och rotorsaksanalyser?
  • Vilka verktyg använder du för övervakning och loggning?
  • Hur arbetar du med automatisering inom drift?
  • Kan du beskriva ett tillfälle då du förbättrade systemets tillförlitlighet?
  • Vilka programmeringsspråk är du mest bekväm med?
  • Hur samarbetar du med utvecklingsteam i din roll?
  • Har du erfarenhet av att arbeta i beredskapsschema?
  • Hur säkerställer du att system är skalbara och säkra?
  • Vilken roll spelar dokumentation i ditt arbete?